Source | # of sentences | Average logarithmic rank |
---|---|---|
n-tv.de vom 24.05.2005 | 15 | 5.63 |
n-tv.de vom 25.06.2005 | 13 | 5.70 |
n-tv.de vom 29.09.2005 | 15 | 5.71 |
an-online.de vom 07.10.2005 | 15 | 5.71 |
n-tv.de vom 05.08.2005 | 24 | 5.72 |
an-online.de vom 19.09.2005 | 12 | 5.72 |
tagesspiegel.de vom 18.07.2005 | 11 | 5.73 |
rtl.de vom 07.10.2005 | 26 | 5.73 |
tagesspiegel.de vom 21.07.2005 | 11 | 5.74 |
tagesspiegel.de vom 13.11.2005 | 12 | 5.74 |
n-tv.de vom 24.08.2005 | 13 | 5.74 |
rtl.de vom 29.08.2005 | 23 | 5.75 |
kn-online.de vom 14.11.2005 | 14 | 5.75 |
tagesschau.de vom 06.06.2005 | 26 | 5.76 |
thueringer-allgemeine.de vom 24.06.2005 | 12 | 5.76 |
thueringer-allgemeine.de vom 08.06.2005 | 13 | 5.76 |
faz.net vom 05.08.2005 | 11 | 5.76 |
thueringer-allgemeine.de vom 08.08.2005 | 13 | 5.76 |
tagesschau.de vom 16.08.2005 | 29 | 5.77 |
de.news.yahoo.com vom 05.06.2005 | 19 | 5.78 |
tagesspiegel.de vom 01.07.2005 | 16 | 5.78 |
faz.net vom 14.07.2005 | 12 | 5.78 |
n-tv.de vom 13.07.2005 | 19 | 5.78 |
tagesspiegel.de vom 05.08.2005 | 17 | 5.78 |
sueddeutsche.de vom 01.02.2005 | 12 | 5.79 |
tagesschau.de vom 13.09.2005 | 43 | 5.79 |
tagesschau.de vom 26.04.2005 | 20 | 5.80 |
frankenpost.de vom 23.06.2005 | 18 | 5.80 |
n24.de vom 31.08.2005 | 18 | 5.80 |
n-tv.de vom 04.06.2005 | 16 | 5.80 |
Source | # of sentences | Average logarithmic rank |
---|---|---|
wallstreet-online.de vom 16.12.2005 | 15 | 7.09 |
merkur-online.de vom 24.12.2005 | 12 | 7.02 |
wallstreet-online.de vom 09.11.2005 | 12 | 7.02 |
merkur-online.de vom 21.12.2005 | 11 | 6.97 |
merkur-online.de vom 06.08.2005 | 21 | 6.96 |
mainpost.de vom 01.10.2005 | 11 | 6.94 |
westfalenpost.de vom 23.07.2005 | 15 | 6.91 |
handelsblatt.com vom 09.10.2005 | 12 | 6.88 |
wallstreet-online.de vom 08.11.2005 | 15 | 6.87 |
wallstreet-online.de vom 15.11.2005 | 12 | 6.83 |
n-tv.de vom 31.01.2005 | 18 | 6.81 |
lvz-online.de vom 28.07.2005 | 16 | 6.81 |
handelsblatt.com vom 07.08.2005 | 31 | 6.81 |
wallstreet-online.de vom 28.10.2005 | 11 | 6.80 |
merkur-online.de vom 22.12.2005 | 14 | 6.78 |
handelsblatt.com vom 05.06.2005 | 18 | 6.78 |
gea.de vom 12.07.2005 | 18 | 6.78 |
sueddeutsche.de vom 28.05.2005 | 13 | 6.76 |
volksstimme.de vom 11.10.2005 | 13 | 6.75 |
sueddeutsche.de vom 06.01.2005 | 11 | 6.75 |
kn-online.de vom 30.07.2005 | 12 | 6.75 |
handelsblatt.com vom 01.08.2005 | 25 | 6.74 |
lvz-online.de vom 05.10.2005 | 14 | 6.74 |
handelsblatt.com vom 24.10.2005 | 27 | 6.73 |
kn-online.de vom 15.06.2005 | 12 | 6.73 |
handelsblatt.com vom 22.08.2005 | 35 | 6.73 |
merkur-online.de vom 28.12.2005 | 20 | 6.73 |
lvz-online.de vom 14.11.2005 | 12 | 6.72 |
merkur-online.de vom 27.06.2005 | 14 | 6.72 |
aachener-zeitung.de vom 21.12.2005 | 16 | 6.72 |
In this subsection we replace average word length by average logarithmic word rank. The logarithm of the word rank is taken because we want to punish words of high ranks only moderately.
First table:
select source, count(distinct i_s.s_id) as cnt_s, round(avg(log(w.w_id-100)),2) as av from sources so, inv_so i_s, inv_w i, words w where so.so_id=i_s.so_id and i_s.s_id=i.s_id and i.w_id=w.w_id and w.w_id>100 group by source having cnt_s>10 order by av LIMIT 30;
6.4.2.1 Average word length for different sources
6.4.2.3 Sources consisting of many / few words with frequency 1
6.4.2.4 Sources with low / high average word length of rare words